PC向け連続音声認識プログラムJuliusのSuperHマイコン(SH-4A)への搭載に関して行った処理の高速化と,評価実験について報告する.計算リソースの限られたマイコン上で動作させるため,仮説探索時のメモリ管理の最適化や音響尤度計算の高速化を実施した.語彙数5,000語での評価実験では,最適化前のJuliusの実行速度に対して3.7倍の高速化を実現し,SH-4A上での実時間動作を達成した.また,語彙数20,000単語での評価でも実時間の1.25倍で動作すること確認した.最後に,応用アプリケーションとしてT-Engine上に実装した質問応答システムについて報告する.To expand CSR (continuous speech recognition) software to the mobile environmental use, we have developed embedded version of Julius (Embedded Julius). In this paper, we describe an implementation of the "Embedded Julius" on a SH-4A microprocessor. SH-4A is a high-end MPU with on-chip FPU. However, further computational reduction is necessary for the CSR software to operate real-time. Applying some optimizations (efficient memory management, modified GMS), th...
EUROSPEECH2001: the 7th European Conference on Speech Communication and Technology, September 3-7, ...
设计一种便于芯片技术实现、结构简单的语音特征提取电路.它由带通滤波器组、整流电路和低通滤波器构成.同时,借此电路阐述一种充分利用器件特性设计电路的思想.这种思想以完成功能为目的,不以完成算法为目标.据...
This work analyzes Continuous Automatic Speech Recognition (CSR) and in contrast to prior work, it s...
MMSP2007: IEEE 9th International Workshop on Multimedia Signal Processing, October 1-3, 2007, Crete...
MMSP2006: IEEE 8th International Workshop on Multimedia Processing, October 3-6, 2006, Victoria, B...
ISPACS2006: International Symposium on Intelligent Signal Processing and Communication Systems, Dece...
This thesis presents a fully pipelined and parameterised parallel hardware implementation of a large...
人工神经网络具有强大的模式分类能力,除此之外还有一个优点即其大量的并行神经计算能力,使得以低廉的硬件开销来实现高速并行运算成为可能,这在实时模式识别中是非常重要的.文章介绍了以预言神一号小型神经计算机...
[[abstract]]此篇論文主要探討以最小錯誤鑑別式研究(Minimum Classification Error, MCE)訓練模型與其他訓練模型的方式比較,並以不同之強健方法提升語音辨識系統中...
Abstract—Julius is an open-source large-vocabulary speech recognition software used for both academi...
MSc (Computer Science), North-West University, Mafikeng Campus, 2014In a typical recognition process...
Abstract—Julius is an open-source large-vocabulary speech recognition software used for both academi...
[[abstract]]在數位娛樂產業中,接近真實感受的介面逐漸被開發,更多型態的操控介面被提出和應用於數位娛樂產業中。過往因正確率過低無法實用的語音介面也因技術和操控性提升漸漸導入數位娛樂產業。語音...
说话人识别技术作为生物特征识别的一个方向,在理论和应用领域都得到了快速发展和广泛关注。本文主要是对基于i-vector的说话人识别算法进行研究,在此基础上引入了PLDA信道补偿算法以及海量数据的无标注...
[[abstract]]此篇論文提出一個針對噪音環境下的強健性語音辨識技術,我們將此一技術應用於語音辨識系統中,此辨識系統使用模擬二維倒頻譜(Modified two-dimension cepstr...
EUROSPEECH2001: the 7th European Conference on Speech Communication and Technology, September 3-7, ...
设计一种便于芯片技术实现、结构简单的语音特征提取电路.它由带通滤波器组、整流电路和低通滤波器构成.同时,借此电路阐述一种充分利用器件特性设计电路的思想.这种思想以完成功能为目的,不以完成算法为目标.据...
This work analyzes Continuous Automatic Speech Recognition (CSR) and in contrast to prior work, it s...
MMSP2007: IEEE 9th International Workshop on Multimedia Signal Processing, October 1-3, 2007, Crete...
MMSP2006: IEEE 8th International Workshop on Multimedia Processing, October 3-6, 2006, Victoria, B...
ISPACS2006: International Symposium on Intelligent Signal Processing and Communication Systems, Dece...
This thesis presents a fully pipelined and parameterised parallel hardware implementation of a large...
人工神经网络具有强大的模式分类能力,除此之外还有一个优点即其大量的并行神经计算能力,使得以低廉的硬件开销来实现高速并行运算成为可能,这在实时模式识别中是非常重要的.文章介绍了以预言神一号小型神经计算机...
[[abstract]]此篇論文主要探討以最小錯誤鑑別式研究(Minimum Classification Error, MCE)訓練模型與其他訓練模型的方式比較,並以不同之強健方法提升語音辨識系統中...
Abstract—Julius is an open-source large-vocabulary speech recognition software used for both academi...
MSc (Computer Science), North-West University, Mafikeng Campus, 2014In a typical recognition process...
Abstract—Julius is an open-source large-vocabulary speech recognition software used for both academi...
[[abstract]]在數位娛樂產業中,接近真實感受的介面逐漸被開發,更多型態的操控介面被提出和應用於數位娛樂產業中。過往因正確率過低無法實用的語音介面也因技術和操控性提升漸漸導入數位娛樂產業。語音...
说话人识别技术作为生物特征识别的一个方向,在理论和应用领域都得到了快速发展和广泛关注。本文主要是对基于i-vector的说话人识别算法进行研究,在此基础上引入了PLDA信道补偿算法以及海量数据的无标注...
[[abstract]]此篇論文提出一個針對噪音環境下的強健性語音辨識技術,我們將此一技術應用於語音辨識系統中,此辨識系統使用模擬二維倒頻譜(Modified two-dimension cepstr...
EUROSPEECH2001: the 7th European Conference on Speech Communication and Technology, September 3-7, ...
设计一种便于芯片技术实现、结构简单的语音特征提取电路.它由带通滤波器组、整流电路和低通滤波器构成.同时,借此电路阐述一种充分利用器件特性设计电路的思想.这种思想以完成功能为目的,不以完成算法为目标.据...
This work analyzes Continuous Automatic Speech Recognition (CSR) and in contrast to prior work, it s...